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(54) Precede et dispositif pour evaluer les consultations de sites web 



(57) On equipe de moyens de mesure un ensemble 
de terminaux informatiques (1 ) relies au reseau (R). Les 
moyens de mesure (7) dont sont equipes un terminal de 
cet ensemble recoivent des messages d'acces emis par 
le terminal vers le reseau, retransmettent ces messages 
sur le reseau, detectent si chacun de ces messages 



concerne Tun des sites dont les consultations sont a 
evaluer, et adressent des donnees de mesure a un ser- 
veur de collecte relie au reseau en reponse a la detec- 
tion d'au moins un message concernant I'un des sites 
en question. Le serveur de collecte assure un traitement 
statistique des donnees de mesures recues pour esti- 
mer les nombres de consultations des sites. 
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Description 

[0001] La presente invention concerne le domaine 
des reseaux informatiques : notammentde ('Internet ba- 
ses sur la famille de protocoles IP (voir D. Comer, "In- 
ternetworking with TCP/IP", Prentice Hall, 1995). Elle 
vise a offrir une solution au probleme de la mesure fiable 
et neutre de I'audience des differents services et pro- 
grammes disponibles sur un tel reseau. En particulier, 
la caracterisation du flux de requetes envoyees vers un 
serveur Web particulier est souhaitable, de meme que 
celle de I'ecoute de canaux de distribution (multicast). 
[0002] L'invention a pour application la mise en place 
d'une infrastructure de suivi de I'audience des services 
proposes sur des reseaux tels que I'lntemet, permettant 
des traitements statistiques selon des principes analo- 
gues a ceux utilises aujourd'hui pour la mesure de 
I'audience des chalnes de television. L'existence de me- 
sures d'audience fiables et neutres est un facteur n£- 
cessaire pour faire de I'lnternet un media grand public, 
credible aupres des annonceurs. 

[0003] Une famille d'outils et de methodologies dispo- 
nibles aujourd'hui vise a mesurer I'audience au niveau 
des serveurs (voir par exemple US-A-5 732 218). Ceci 
permet d'obtenir un comptage des requetes de pages 
Web hebergees par ce serveur. Les suivis d'audience 
sont actuellement realises sur la base de ces indica- 
tions. 

[0004] Une amelioration de la methode precedente, 
en cours de developpement, vise a rendre plus repre- 
sentatives les mesures fournies en prenant en compte 
Taction des "caches" (qui masquent certaines reque- 
tes). Cette etude est en cours dans le cadre de I'lETF 
(voir J. Mogul, P. Leach; "Simple hit metering and usage 
limiting for HTTP", Draft RFC, Internet Engineering Task 
Force, 1 997 ; ou J. Pitkow, « In search of reliable usage 
data on the WWW », Computer Network and ISDN sys- 
tems, Vol. 29, No. 8-13, septembre 1997, pages 
1343-1355). Elle consiste pour les "caches'* a aller in- 
former les serveurs du nombre de reponses qu'iis ont 
fournies en leur nom. 

[0005] Aucune solution connue ne propose de mesu- 
rer I'audience des services reseau au niveau des termi- 
naux d'utiiisateurs. La mesure d'audience au niveau des 
serveurs souffre de limitations multiples: 

elle necessite d'equiper chaque serveur a cet effet, 
ce qui est difficile a gerer compte tenu de leur pro- 
liferation; 

elle n'est pas adaptee a la fourniture de mesures 
d'audience par un tiers independant; 
elle est peu fiable a cause des mecanismes de "ca- 
che" et d'agents dits "proxy" (qui envoient des re- 
quetes au nom d'un ensemble de terminaux, sou- 
vent pour des raisons de securite); 
elle n'est pas applicable aux techniques de distribu- 
tion (multicast). 



[0006] Les etudes sur la remontee par les "caches" 
du nombre de requetes qu'iis ont interceptees ne s'in- 
teressent qu'a la troisieme limitation, et elargissent le 
probleme a un nouvel ensemble d'equipements : a 
s moins de controler tous les "caches", on ne peut pas 
etre certain de la veracite de leurs informations, et il est 
done difficile de considerer ces chiffres comme fiables. 
[0007] Dans W098/10349, il est propose que le site 
consulte retourne la page Web demandee avec un mor- 
10 ceau de programme qui, chez le client, surveille I'affi- 
chage a I'ecran de la page et commande le renvoi d'in- 
formations relatives a cette surveillance. Ce document 
aborde le probleme de la non neutrality du site consulte 
vis-a-vis de la mesure d'audience: Une solution propo- 

75 see pour traiter ce probleme consiste a crypter les in- 
formations de surveillance retournees par le client de 
facon que seul un tiers independant soit capable de les 
decrypter. Une autre solution consiste en ce que le site 
consulte reponde a une requete issue d'un client en re- 

20 transmettant la requete et la page concernee au site in- 
dependant, lequel se charge de retransmettre la page 
demandee et le morceau de programme approprie vers 
le site du client. Celui-ci retourne alors les informations 
de surveillance directement au site independant. Les 

2 $ solutions preconisees dans ce document permettent de 
ne pas equiper les terminaux clients d'un logiciel special 
pour la mesure d'audience. Le but poursuivi est d'es- 
sayer que les mesures effectuees soient le plus exhaus- 
tives possible. Mais ces solutions impliquent : 

30 

que le contenu des pages residentes dans le ser- 
veur de contenu soit modifie afin d'emettre une re- 
quete vers le secteur de collecte en meme temps 
que le contenu interessant le client (methode non 
35 universelle necessitant de reediter I'ensemble des 
pages sur les serveurs) ; 

que information soit acheminee par un serveur in- 
dependant avant d'arriver chez le client, ce qui a 
necessairement un impact sur la qualite percue du 
40 service. 

[0008] L'invention a pour but de permettre une nou- 
velle approche de la mesure de I'audience sur Internet, 
basee sur une observation a la source des requetes pro- 
45 duites par les usagers. 

[0009] L'invention propose ainsi un procede tel que 
defini dans la revendication 1 . 

[0010] Un panel de clients, dont les terminaux sont 
equipes des moyens de mesure, pourra alors fournir en 
50 temps reel a une entite independante gerant le serveur 
de collecte le compte exact des sites explores et des 
canaux ecoutes. Le procede presente les avantages: 
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de permettre d'utiliser les modeles de mesure 
d'audience (panel choisi sur la base de sa repre- 
sentative sociologique) qui ont ete developpes 
pour les programmes de television. En particulier, il 
est possible d'associer un profil d'utilisateur a cha- 
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que terminal observe, ce qui rend plus pertinentes 
les donnees obtenues; 

de ne pas necessiter d'instrumentation specifique 
au niveau de chaque serveur ou canal observe, 
etant donne qu'on se place a la source des reque- 
tes; 

d'etre insensible aux interventions des "caches" 
puisque les requetes sont observees des leur sour- 
ce; 

d'etre deployable par un acteur economique inde- 
pendant des reseaux et des services empruntes, ce 
qui est capital vis-a-vis de la neutrality des informa- 
tions fournies; 

de s'appliquer egalement aux services Internet uti- 
lisant la distribution; 

de pouvoir observer en temps reel les actions (re- 
quetes) des usagers du reseau; 
d'etre transparent (c'est-a-dire non contraignant et 
evolutif) vis-a-vis des applications utilisees pour 
"naviguer" sur le reseau. 



[0011] Un mode de realisation prefere du procede se- 
lon I'invention est enonce dans la revendication 2. 
[0012] De cette maniere, on est capable non seule- 
ment d'evaluer les nombres de consultations des sites, 
mais encore d'analyser la qualite offerte aux usagers 
lors de ces consultations (temps de reponse, vitesse, 
volumes d'information transmis...). Les resultats de ces 
analyses peuvent etre communiques aux personnes 
gerant les sites concernes pour leur permettre d'adapter 
les moyens qu'elles mettent en oeuvre. 
[001 3] Un autre aspect de I'invention se rapporte a un 
module de detection de messages et de transmission 
d' informations tel que defini dans la revendication 3. 
[001 4] D'autres particulates et avantages de la pre- 
sente invention apparaitront dans la description ci- 
apres d'exemples de realisation non limitatifs, en refe- 
rence aux dessins annexes, dans lesquels : 

les figures 1 et 2 sont des representations schema- 
tiques de reseaux informatiques ; et 
la figure 3 est un schema d'un terminal equipe d'un 
module selon I'invention, illustrant son fonctionne- 
ment avec le reseau. 

[0015] La figure 1 montre schematiquement un re- 
seau R fonctionnant selon un protocofe de la famille IP 
("Internet Protocol"), auquel sont relies un certain nom- 
bre de terminaux 1 depuis lesquels des requetes d'ac- 
ces peuvent etre emises sur le reseau R. La reference 
2 designe des serveurs hebergeant des sites (pages 
Web) qui peuvent etre consultes par les terminaux 1 via 
le reseau. 

[001 6] Un ou plusieurs serveurs de collecte S sont re- 
lies au reseau R afin de recevoir et traiter des donnees 
de mesure issues de certains terminaux 1. L'entite ge- 
rant un tel serveur de collecte S s'adresse a un panel 
d'usagers detenteurs de terminaux 1 relies au reseau 



R, et leur fournit des moyens de mesure consistant en 
un module 7 decrit ci-apres. Les modules 7 interceptent 
les messages de requete d'acces emis par des applica- 
tions executees dans les terminaux en question, pour 
5 identifier les sites interroges, determiner le type de na- 
vigateur utilise et effectuer des mesures dont les resul- 
tats sont ensuite fournis au serveur S. Celui-ci peut en- 
suite effectuer toutes sortes de traitements statistiques 
pour analyser I'audience des sites 2. Le panel d'usagers 
io est done determine en fonction de criteres de represen- 
tative du meme genre que ceux utilises dans le domai- 
ne de la mesure d'audience des chames de television. 
[0017] Dans le cas ou il y a plusieurs serveurs de col- 
lecte S, un serveur de configuration C est accessible 
*5 par le reseau R afin de fournir aux modules 7 les infor- 
mations de localisation (telles que I'adresse, le numero 
de port et le protocole a utiliser) du serveur de collecte 
S auquel ils doivenl s'adresser. 

[0018] Les applications informatiques concues pour 
20 acceder au reseau ulilisenl des interfaces logicielles de 
programmation ("Application Programming Interface", 
ou API) Ces interfaces de communication en reseau 
font partie des ressources offertes par le systeme d'ex- 
ploitation de chaque terminal. Elles permettent d^acce- 
2S der aux protocoles de communication implantes en uti- 
lisant un ensemble de "primitives", qui appellent- des 
fonctions elementaires permettant d'ouvrir une^con- 
nexion vers une adresse distante, d'envoyer et de "rece- 
voir des donnees, de selectionner un canal de distribu- 
30 tion (multicast channel), etc. Ces primitives sont ensuite 
traduites en messages elementaires du protocoje en 
question (voir illustration en figure 2) . Dans les termi- 
naux, le fonctionnement-selon le protocole de commu- 
nication est assure par d'autres ressources logicielles 
35 du systeme d'exploitation (gestionnaire de protocole) 
associees a des cartes de communication apprbpriees. 
[0019] La figure 3 montre un module 7 de detection 
de messages et de transmission d'informations dont 
sont equipes les terminaux 1, raccordes au reseau R, 
40 des usagers du panel retenu par l'entite gerant un ser- 
veur de collecte S. 

[0020] Sur la figure 3, la reference 5 designe les ele- 
ments de la couche de protocole IP dont est equipe un 
terminal 1, et la reference A designe I'API correspon- 
ds dante, prevue dans le terminal l pour realiser I'interface 
entre le gestionnaire de protocole 5 et les applications 
6 executes sur le terminal 1 et susceplibles de com- 
muniquer via le reseau. 

[0021] Le module logiciel 7 presente vis-a-vis des ap- 
$o plications 6 une interface notee A' qui comprend au mi- 
nimum I'ensemble obligatoire des fonctions offertes par 
I'interface A: 

[0022] Dans le cas courant ou le terminal fonctionne 
avec le systeme d'exploitation Windows commercialise 
55 par la societe Microsoft, I'interface A peut etre I'interface 
Winsock. Dans ce cas, le module logiciel 7, qui presente 
I'interface A vis-a-vis des applications 6, porte le nom 
habituel du gestionnaire de protocole standard 
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(Wsock32.dll dans le cas des versions Windows 95 et 
Windows NT 3.5 ou 4.0). Le module 7 appelle a son tour 
le gestionnaire de protocole standard 5 qui aura ete iso- 
le des applications 6, c'est-a-dire place dans un reper- 
toire non prioritaire. 

[0023] Le module 7 comprend un filtre de primitives 
8, un decodeur de requetes 9 S un module 10 de gestion 
de la configuration, et un module 11 de transmission de 
donnees. 

[0024] Le filtre de primitives 8 recoit les messages 
conformes a Pinterface A. Si le message est issu d'une 
application 6 et correspond a un flux de donnees sur 
lequel Paudience doit etre mesuree, il est fourni au de- 
codeur de requetes 9. Sinon, il est relaye de facon in- 
changee vers le gestionnaire de protocole 5. Ceci per- 
met d'assurer la transparence du procede, les messa- 
ges n'etant pas alteres. La definition et ['identification 
des flux a observer sont fournis au filtre de primitives 8 
par le module de configuration 10. 
[0025] Le decodeur de requetes 9 agit sur les flux 
aiguilles par le filtre de primitives 8. II analyse le contenu 
des messages selectionnes et en deduit des enregis- 
trements elementaires, ou donnees de mesure, consti- 
tues des informations d'audience (serveur consulte : ca- 
nal ecoute) auxquelles est attachee une etiquette d'ho- 
rodatage. Les messages analyses sont eux aussi re- 
layes, de facon inchangee, vers le gestionnaire de pro- 
tocole 5. 

[0026] Le module de gestion de la configuration 10 
permet de programmer le filtre 8 et le decodeur 9 en 
fonction des informations souhaitees. Ce module 10 
dialogue avec le serveur de collecte S et/ou avec le ser- 
veur de configuration C via le gestionnaire de protocole 
5 et le reseau R, ce qui permet defaire evoiuer aisement 
sa configuration. 

[0027] Le module de transmission des donnees 11 
dialogue avec le serveur S via le gestionnaire de proto- 
cole 5 et le reseau R, en lui renvoyant en temps reel les 
enregistrements elementaires produits par le decodeur 

9. 

[0028] Des que Papplication 6 accede pour la premie- 
re fois au reseau R, le module de gestion de configura- 
tion 10 envoie une requete au serveur de configuration 
C a travers ('interface A, pour initialiser un dialogue re- 
presents par la reference 20 sur la figure 3. Cette re- 
quete inclut au minimum ['identification de Papplication 
6. Le serveur C retourne des informations 21 caract6ri- 
sant les flux devant faire Pobjet d'observations par le mo- 
dule 7 (ces informations 21 sont transmises au filtre de 
primitives 8) ainsi qu'une description des informations a 
collecter (ces informations 22 sont transmises au deco- 
deur de requetes 9). Les parametres fournis peuvent 
notamment inclure: 

la description des applications 6 dont les requetes 
devront etre decodees; 

Padresse IP et le port TCP (Transmission Control 
Protocol) du serveur de collecte S auquel les don- 



nees de mesure devront etre transmises; 
Padresse IP et le port TCP du serveur de configu- 
ration C qui servira a la prochaine mise en service 
du module 7; 

5 - une information permettant de determiner le deca- 
lage entre Phorloge locale (non modifiable) du ter- 
minal 1 et I'horloge du serveur S. 

[0029] A chaque acces au reseau R depuis le terminal 
io 1, Papplication 6 fournit au module 7 un message 25 
conforme a la specification de Pinterface A. Le filtre de 
primitives 8 determine si ce message 25 doit etre pris 
en consideration ou non dans le cadre des mesures 
d'audience. Si le message n'est pas pris en considera- 

*5 tion, il est simplement transmis au gestionnaire de pro- 
tocole 5 (reference 26 sur la figure 3) qui va proceder a 
son acheminement sur le reseau R jusqu'a sa destina- 
tion 2 (reference 28). Si le message doit etre analyse 
(reference 27), le decodeur de requetes 9 extrait de son 

20 contenu les informations pertinentes, et en deduit des 
donnees de mesure qu'il enregistre. Pour assurer la 
transparence du module 7, ce message 27 est retrans- 
mis par le decodeur de requetes 9 vers le gestionnaire 
de protocole 5 pour son acheminement inchange dans 

25 le reseau. 

[0030] Dans le sens de la reception, tous les messa- 
ges 32 passes au module 7 par le gestionnaire de pro- 
tocole 5 sont delivres sans changement a Papplication 
destinataire 6 via le decodeur de requetes 9 et le filtre 

30 de primitives 8. Le decodeur de requetes 9 se charge 
d'estimer des elements de qualite de service de la con- 
nexion. Des exemples de parametres de qualite de ser- 
vice pouvant etre mesures sont: 



35 



40 



Paccessibilite du serveur distant interroge (succes 
de la connexion); 

le temps de connexion au serveur; 
la duree necessaire pour charger le document de- 
mande (fonction du debit utile moyen de la con- 
nexion); 

Peventuel arret du transfert en cours, soit du cote 
du terminal soit du cote du reseau ... 



[0031 ] Les donnees de mesure 30 obtenues par le de- 
45 codeur de requetes 9 sont fournies au module de trans- 
mission de donnees 11. Ce module 11 se connecte au 
serveur de collecte S a travers Pinterface A et le ges- 
tionnaire de protocole 5, et lui transmet en temps reel 
les donnees de mesure produites par le decodeur 9 
50 (message 31). 

[0032] Dans le cas du service Web porte par la pile 
de protocoles TCP/HTTP (voir D. Comer, Internetwor- 
king with TCP/IP", Prentice Hall, 1995), le decodeur de 
requetes 9 extrait des messages HTTP (Hypertext 
55 Transfer Protocol, voir HTTP/1.0, RFC 1945, Internet 
Engineering Task Force, 1996) les informations d'iden- 
tification du serveur S, le type de transaction effectue et 
la nature des documents demandes. 
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[0033] Par exemple, avec la version 1.0 de HTTP, 
trois transactions elementaires sont prevues, a savoir 
GET (pour demander un document), HEAD (pour de- 
mander uniquement I'entete d'un document) et POST 
(pour transmettre des informations au serveur). Pour 
chacune de ces commandes, le message est analyse 
par le decodeur de requetes 9 afin d'en extraire I'URL 
(Uniform Ressource Locator) qui identifie a la fois un 
document et une machine serveur. 
[0034] Un traitement specifique est effectue dans le 
cas du protocole IGMP (Internet Group Membership 
Protocol) qui permet aux terminaux de s'inscrire comme 
membres d'un groupe de distribution particulier (com- 
mande par des options particulieres de I'interface A). 
[0035] Les donnees de mesure 30 fournies par le de- 
codeur de requetes 9 au module de transmission de 
donnees 11 peuvent comprendre, sous la forme d'une 
chaine de caracteres a un format determine, les quatre 
informations suivantes: 

identification du terminal 1, creee lors de I'installa- 
tion du module 7 dans le terminal 1 . Cette identifi- 
cation, en principe invariable, est par exemple co- 
dee sur 32 bits. Elle permettra au serveur S d'etablir 
des statistiques en fonction du type d'usagers; 
nom de Implication 6 d'ou provient ia requete, cette 
information permettant notamment de connaitre le 
logiciel de recherche employe; 
Pinstant d'emission et de conclusion de la requete, 
permettant d'analyser la distribution temporelle du 
trafic ainsi que les elements de qualite de service; 
I'URL ou I'adresse de groupe permettant d'identifier 
les donnees demandees. 

[0036] Lorsqu'il est etabli que ('application active 6 a 
pour objet la recherche d'informations via le reseau R 
(navigation Web), le module il initialise une communica- 
tion vers le serveur de collecte S a I'aide de la primitive 
"connect" si cette communication n'est pas deja etablie. 
Les donnees de mesure 30 fournies par le decodeur de 
requetes 9 sont ensuite envoyees au serveur S au vol. 
La connexion entre le module 1 1 et le serveur S est rom- 
pue lorsque toutes les "sockets" ouvertes par I'applica- 
tion 6 auront ete fermees. 

[0037] On a vu que la meme entite peut gerer plu- 
sieurs serveurs de collecte S relies au reseau R, diffe- 
rences par leur adresse IP et/ou leur port TCP. L'adres- 
se IP et le port TCP du serveur S auquel doit se con- 
necter le module 7 equipant un terminal particulier sont 
alors specifies de facon dynamique par le module 1 0 de 
gestion de la configuration. Ceci permet d'assurer un 
partage de charge entre les differents serveurs de col- 
lecte. 
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Revendications 

1 . Procede pour evaluer les consultations de sites (2) 
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ou de canaux de diffusion accessibles par un re- 
seau de telecommunications (R) , dans lequel on 
relie au reseau au moins un serveur de collecte (S) 
et on equipe de moyens de mesure un ensemble 
de terminaux informatiques relies au reseau, les 
moyens de mesure (7) dont sont equipes un termi- 
nal dudit ensemble etantagences pour recevoirdes 
messages d'acces emis par le terminal vers le re- 
seau, pour retransmettre ces messages sur le re- 
seau, pour detecter si chacun de ces messages 
concerne Tun des sites dont les consultations sont 
a evaluer et pour adresser des donnees de mesure 
au serveur de collecte par I'intermediaire du reseau 
en reponse a la detection d'au moins un message 
concernant fun desdits sites, le serveur de collecte 
assurant un traitement des donnees de mesures re- 
cues pour estimer les nombres de consultations 
des sites. 

Procede. selon la revendication 1, dans lequel les 
moyens de mesure (7) dont sont equipes un termi- 
nal (1) evaluent la qualite de communication lors 
d'un echange de messages entre le terminal^eM'un 
desdits sites par I'intermediaire du reseau, ; .et in- 
cluent dans les donnees de mesure adressees au 
serveur de collecte (S) des informations sur la<qua- 
lite evaluee. 

' Sir 

Module de detection de messages et de transmis- 
sion d'informations, a installer dans un terminal in- 
formatique (1 ) raccorde a un reseau de telecommu- 
nications (R), et comprenant: 

un filtre de primitives (8) recevant des messa- 
ges emis vers le reseau par des applications 
(6) executees dans le terminal, pour identifier 
ceux de ces messages qui se rapportent a des 
requetes d'acces a certains sites (2) accessi- 
bles par le reseau et pour transmettre les 
autres messages vers le reseau; 
un decodeur de requetes (9) recevant les mes- 
sages de requete d'acces identifies par le filtre 
de primitives (8), pour analyser ces messages 
et obtenir ainsi des donnees de mesure, et pour 
transmettre ces messages vers le reseau; et 
des moyens de transmission de donnees (11) 
pour transmettre les donnees de mesure obte- 
nues par le decodeur de requetes a un serveur 
de collecte (S) accessible par le reseau. 

Module selon la revendication 3, comprenant en 
outre des moyens de gestion de configuration (10) 
pour obtenir d'un serveur de configuration (C) et/ou 
du serveur de collecte (S), via le reseau (R), des 
parametres de configuration du filtre de primitives 
(8) et du decodeur de requetes (9). 
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FIG. 1 
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